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\54j FRAGMENTS D'ACIDES NUCLEIQUES SPECIFIQUES DE MYCOBACTERIES MEMBRES DU COMPLEXE M. 
TUBERCULOSIS ET LEURS APPLICATIONS POUR LA DETECTION ET LE DIAGNOSTIC DIFFERENTIEL DES 
MEMBRES DU COMPLEXE M. TUBERCULOSIS. 

(^7y Cette invention concerne un fragment d'acides nuclei- 
ques specifique de mycobacterias appartenant au com- 
plexe M. tuberculosis, comprenant un enchainement de nu- 
cleotides choisi parmi la sequence SEQ ID n" 1. la 
sequence SEQ ID n° 2. leurs sequences complementaires 
ou les sequences d'acides nucleiques capables de s'hybri- 
der a Tune des sequences precedentes dans des condi- 
tions de stringence adequates. 

Elle vise egalement les utilisations desdites sequences 
pour la detection et ie diagnostic differentiel de mycobacte- 
ries membres du complexe M. tuberculosis, notamment le 
diagnostic differentiel du BCG des autres membres du 
complexe. 
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La presente invention concerne des sequences 
d'acides nucleiques de mycobacterias appartenant au 
complexe M. tuberculosis . 

L ' invention concerne egalement une methode de 
detection in vitro de souches de mycobac teries apparte- 
nant au complexe M. tuberculosis ainsi qu'une methode 
pour un diagnostic differentiel de souches du complexe 
M. tuberculosis , notamment pour differencier la presence 
du BCG de celle des autres membres du complexe dans un 
echantillon. 

Approximativement , 1,7 milliard de personnes 
soit 1/3 de la population mondiale sont infectees par M. 
tuberculosis {Sudre et al . , 1992). En 1990, le nombre de 
cas de tuberculose estime etait de 8 millions, dont 2,9 
millions de morts (Sudre et al . , 1992). Ces dernieres 
annees, le nombre de cas de tuberculose aux Etats-unis 
et en Europe a augmente de 3 a 6 % par an, principalement 
dans des populations a haut risque telles que les 
patients souffrant de sida, les alcooliques chroniques, 
les sans-abris et les toxicomanes (Barnes et al . , 1991). 

Compte tenu des difficultes a combattre les 
infections par mycobac teries , il existe un besoin urgent 
de pouvoir disposer d'une methode rapide specif ique et 
sensible, permettant de diagnostiquer ces infections. 
Aussi, la detection precoce de M. tuberculosis dans des 
echantillons cliniques prend-elle une importance crois- 
. sante dans le controle de la tuberculose tant pour le 
traitement clinique de patients infectes que pour 
1 ' identification d ' individus a risque exposes. 

La detection par PCR (Polymerase Chain 
Reaction) d'ADN specif ique d'especes de mycobacteries est 
probablement 1 ' une des nouvelles approches les plus 
prometteuses pour un diagnostic rapide, specif ique et 
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sensible (Saiki et al . , 1985 ; Brisson-Noel et al., 1989; 
Cousins et al . , 1992 ; Eisenach et al . , 1990 ; Forbes 
et al., 1993 ; Fries et al . , 1991 ; Hermans et al . , 1990; 
Jonas et al . , 1993 ; Kolk et al., 1992 ; Pierre et al . , 
1991 ; Saboor et al . , 1992 ; Shankar et' al.,1991 ; 
Sjdbring et al . , 1990). Les differentes etudes realisees 
jusqu'a ce jour ont toutefois abouti a des resultats 
differents en ce qui concerne la specificite et la 
sensibilite. Parmi les raisons de cette diversite, on 
peut notamment citer des differences methodologiques 
concernant la preparation des echantillons , le protocole 
suivi pour 1 ' amplification ou les methodes de detection 
des produits de PCR. 

Plusieurs de ces etudes sont relatives a la 
detection par PCR du complexe M. tuberculosis a partir 
de I'ADN cible IS6110 (Clarridge et al . , 1993 ; Eisenach 
et al., 1990) ; Forbes et al . , 1993) ; Noordhoeck et al . , 

1994) , le gene codant pour l'antigene 65 kDa (Brisson- 
Noel et al., 1991 ; Telenti et al . , 1993), le gene codant 
pour l'antigene 38 kDa (Folgueira et al . , 1993 ; Sjobring 
et al . , 1990) ou 1 ' ARN ribosomique 16S (Kox et al . , 

1995) . Toutefois, tous ces tests de diagnostic identi- 
fient le complexe M. tuberculosis dans son ensemble. 

Le complexe M. tuberculosis comprend M. 
tuberculosis , M. bovis, M. microti et M. africanum. Ces 
quatre especes ont de fortes homologies dans leur ADN (85 
a 100 %) (Imeada, 1985) et possedent plusieurs genes 
totalement identiques . Cette homologie a limite 1' utili- 
sation de sequences d'ADN pour differencier les souches . 
II serait pourtant d ' un interet particulier de pouvoir 
differencier les souches de M. tuberculosis de celles du 
bacille de Calmette-Guerin (BCG) M. bovis, ces dernieres 
etant souvent utilisees comme vaccins vivants pour une 
immunoprotection contre la tuberculose. De facon eviden- 
te, il y a done un interet a distinguer entre des 
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mycobacterias susceptibles d'etre pathogenies et des sou- 
ches BCG vaccinantes. Cette distinction est particuliere- 
ment importante dans le cas d'individus immunodeprimes , 
tels que les sujets infectes par le VIH. 

Les analyses du polymorphisme en longueur des 
fragments de restriction (RFLP ou Restriction Fragment 
Length Polymorphism) basees sur 1 ' insertion de 1' element 
IS6110 ont ete utilisees pour differencier differentes 
souches de M tuberculosis . On a montre que cet element 
d' insertion permettait d'obtenir des profils de RLFP 
specif iques de souches du fait d'une variabilite dans sa 
localisation et dans le nombre de copies existant dans 
les genomes de differentes souches. IS6110 a ete mis en 
evidence chez M tuberculosis et chez M. bovis mais pas 
chez les autres mycobac teries testees (Cave et al . , 
1991). En general, plusieurs copies de cet element 
d' insertion peuvent etre mises en evidence chez M. 
tuberculosis , alors qu'une seule copie est trouvee chez 
M. bovis BCG (Cave et al . , 1991). Toutefois, certaines 
souches de M. tuberculosis sont depourvues de IS6110 (van 
Sooling'en et al . , 1994) et des souches de M. bovis 
possedant un nombre important de copies sont communes 
chez certaines populations (van Soolingen et al . , 1994). 
S'ajoute a ces limitations le fait que 1 ' identification 
des souches de M. tuberculosis a partir de IS6110 
necessite des analyses par Southern Blot et ne peut pas 
facilement etre realisee par des methodes de PCR en 
routine . 

• - Les auteurs de la presente invention ont mis 

en evidence une nouvelle sequence d'ADN cible pour 
amplification enzymatique. Cette sequence fait partie 
d'un operon codant pour un systeme regulateur a deux 
composants specifique de M. leprae et des bacteries 
membres du complexe M. tuberculosis . Les systemes a deux 
composants sont des systemes regulateurs appartenant a 
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une grande famille, impliquant deux proteines qui 
cooperent en traduisant des signaux externes par des 
modifications au niveau de 1' expression genetique 
(Parkinson et Kofoid, 1992. Selon un modele general 
propose, un composant localise dans la membrane agirait 
comme un capteur des changements environnementaux et 
transmettrait 1 ' information a un composant regulateur de 
la reponse dans le cytoplasme, qui a son tour modulerait 
la transcription des genes cibles . La communication entre 
les deux composants est generalement realisee par une 
cascade de phosphorylations. 

Les auteurs de la presente invention ont a 
present clone et caracterise un systeme a deux composants 
raycobacteriens. Ce systeme apparait etre specif ique des 
membres du complexe M. tuberculosis et de M. leprae. De 
fagon inattendue par rapport aux autres systemes a deux 
composants, les genes de ce systeme mycobacterien sont 
separes par des sequences d'ADN (sequences intercis troni- 
ques ou sequences repetees) uniquement presentes parmi 
les souches de mycobacterias du complexe M. tuberculosis 
et chez M. leprae. 

Les auteurs de la presente invention ont par 
ailleurs montre que chez les souches du complexe M. 
tuberculosis , cette region intercistronique correspondait 
a un nombre de repetitions exactes ou tronquees d ' une 
sequence de 77 paires de bases, SEQ ID N * 1, qui pouvait 
varier selon les souches. La sequence tronquee (SEQ ID 
N° 2) est composee de 53 paires de bases et contient une 
courte deletion interne en phase des nucleotides n° 40 
a 66, qui sont substitues par un codon GAG. 

Les auteurs de 1 ' invention ont egalement 
montre que, de fagon surprenante, la sequence tronquee 
(SEQ ID N° 2) etait caracteris tique des membres du 
complexe M . tuberculosis differents du BCG . 

Chez M. leprae, la region intercistronique 
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correspondante est constitute par un variant de 52 paires 
de bases deja decrit par ailleurs et dont la sequence est 
indiquee ci-apres : 

5 ' atg aca ccc gcg cag gcg atg atg cag age gaa gtg acg 
aga ggg aat gtg a 3 ' . 

Compte tenu de leurs caracteristiques , ces 
sequences repetees offrent un interet particulier pour 
identifier et differencier entre elles des souches du 
complexe M. tuberculosis par des techniques 
d" amplification enzymatique, telles que la PCR ou autres 
methodes similaires. Plus particulierement , elles 
permettent d'etablir un diagnostic differentiel entre la 
presence du BCG et celle d* autres membres du complexe 
dans un echantillon biologique. Ce diagnostic differen- 
tiel, dont le principe est base sur la detection speci- 
fique de la sequence SEQ ID N ° 2, constitue un aspect 
prefere de 1" invention. II est avantageusement mis en 
oeuvre pour distinguer une infection par le BCG d'une 
infection par d' autres membres virulents du complexe 
chez des individus immunodeprimes , tels que notamment les 
sujets infectes par le VIH. 

L' invention a done pour objet un fragment 
d'acides nucleiques specif ique de mycobacteries apparte- 
nant au complexe M. tuberculosis, comprenant un enchai- 
nement de nucleotides choisi parmi la sequence SEQ ID NO 
1, la sequence SEQ ID No 2 , leurs sequences complementai- 
res ou les sequences d'acides nucleiques capables de 
s ' hybrider a 1 ' une des sequences precedentes dans des 
conditions de stringence adequates . 

Elle vise egalement 1 ■ utilisation desdites 
sequences pour la fabrication de sondes nucleotidiques 
pour la detection in vitro de mycobacteries appartenant 
au complexe M. tuberculosis et d' amorces oligonucleo- 
tidiques pour 1' amplification enzymatique de sequences 
specifiques des souches membres du complexe M. tuberculo- 
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sis . 

L ' invention a egalement pour objet une 
methode permettant de differencier les souches du 
complexe M. tuberculosis entre elles, particulierement 
de differencier le BCG des mycobacteries pathogenes de 
ce complexe. 

Elle fournit egalement des moyens pour 
differencier des sous-groupes parmi les souches consti- 
tuant le complexe M. tuberculosis. 

Par ailleurs, elle peut permettre de diffe- 
rencier M. leprae des especes et des souches appartenant 
au complexe M. tuberculosis dans un echantillon biologi- 
que . 

Dans le cadre de la presente invention, on 
considere que les conditions de "stringence adequates " 
dans lesquelles deux sequences nucleot idiques peuvent 
s'hybrider sont les conditions definies par le protocole 
recommande par Boehringer Mannheim, a savoir : des 
temperatures de prehybridation, d * hybridation et de 
lavage de 68 °C et un tampon de prehybridation et 
d' hybridation a base de 5 x SSC (Sambrook et al . , 1989) . 

L ' invention a pour objet un fragment d'acides 
nucleiques specifique de mycobacteries du complexe M. 
tuberculosis localise dans la region intercis tronique du 
systeme senX3 -regX3 . 

Comme il sera explique dans les exemples, la 
sequence SEQ D Nol correspond a une entite de 77 paires 
de bases repetee en un nombre different de copies selon 
_ les souches de mycobacteries etudiees. Cette sequence 
repetee possede un cadre de lecture ouvert (ORF ou Open 
Reading Frame) pouvant coder pour un peptide de 25 acides 
amines . 

L ' invention vise ainsi un fragment d'acides 
nucleiques specifique du complexe M. tuberculosis , 
comprenant un enchainement de nucleotides choisi parmi 
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la sequence SEQ ID No l, sa sequence complementaire ou 
les sequences d' acid.es nucleiques capables de s'hybrider 
a 1 ' une des sequences precedentes dans des conditions de 
stringence adequates. 

Selon un autre aspect, 1 ' invention vise un 
fragment d'acides nucleiques specif ique de membres du 
complexe M. tuberculosis differents du BCG, notaitiment les 
especes virulentes M. tuberculosis, M. africanum ou M. 
bovis, comprenant un enchainement de nucleotides choisi 
parmi la sequence SEQ ID No 2 , sa sequence complementaire 
ou les sequences d'acides nucleiques capables de 
s'hybrider a 1 ' une des sequences precedentes dans des 
conditions de stringence adequates. 

Comme cela est en effet illustre par les 
exemples, les souches de BCG sont dif f erentiables de 
toutes les autres souches du complexe M. tuberculosis a. 
cause de 1' absence de la sequence SEQ ID n * 2 dans la 
region intergenique senX3-regX3 chez le BCG (voir tableau 
3 , groupes 4 , 6 , 8 ) . 

Les differentes sequences nucleot idiques de 
1 1 invention peuvent etre d'origine artificielle ou non. 
II peut s ' agir de sequences d ' ADN ou d'ARN. 

Elles peuvent par exemple, etre preparees par 
synthese chimique, ou encore par des methodes mixtes 
incluant des modifications chimiques ou enzymatiques de 
sequences obtenues par criblage de banques de sequences, 
au moyen de sondes elaborees sur la base des sequences 
SEQ ID No 1 ou 2 . De telles banques peuvent etre prepa- 
_rees par des techniques classiques de biologie moleculai- 
re , connues de 1 ' homme de 1 ' art . 

Les sequences nucleotidiques de 1 ' invention 
permettent la realisation de sondes ou d ' amorces nucleo- 
tidiques, capables de s'hybrider specif iquement avec 
celles-ci, leurs sequences d'ARN correspondantes ou les 
genes correspondants . De telles sondes font egalement 
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partie de 1' invention. Elles peuvent etre utilisees comme 
outil de diagnostic in vitro pour la detection, par des 
experiences d' hybridation, de sequences d'acides nuclei- 
ques specif iques de mycobacteries appar tenant au complexe 
M. tuberculosis . 

Preferentiellement, les sondes de 1 ' invention 
comportent au raoins 24 nucleotides consecutifs bien que 
des sondes plus courtes puissent egalement convenir. Au 
maximum celles-ci comportent la region intergenique 
senX3-regX3 complete de M. tuberculosis (IPL) , a savoir 
deux sequences SEQ ID N° 1 successives suivies d'une 
sequence SEQ ID N ° 2. Ce fragment d'ADN comporte 218 
paires de bases . 

Parmi les sondes nucleotidiques preferees 
specifiques des membres du complexe M. tuberculosis , 
figurent notamment la sequence SEQ ID N" 1 dans son 
integralite ou sa sequence complementaire . 

Selon un autre aspect, 1 ' invention vise des 
sondes nucleotidiques pour la detection et la mise en 
evidence de sequences d'acides nucleiques specifiques de 
membres' du complexe M. tuberculosis differents du BCG, 
notamment les especes virulentes M. tuberculosis , M. 
africanum ou M. bovis , ainsi que pour le diagnostic 
differentiel de la presence du BCG dans un echantillon 
biologique contenant des mycobacteries du complexe M. 
t ubercul osi s . 

De telles sondes nucleotidiques sont obtenues 
a partir d'une region de la sequence SEQ ID No 2 enca- 
_drant le codon GAG a la position 40-42 ou de son brin 
complementaire. Preferentiellement, cette region a une 
longueur de 21 paires de bases, et comporte 9 nucleotides 
en amont et en aval du codon GAG specifique de la 
sequence SEQ ID N' 2. 

Avantageusement , ces sondes comprennent la 
sequence SEQ ID No 2 dans son integralite ou sa sequence 
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complementaire . 

Les sondes de 1 ' invention hydrident selon les 
conditions d ' hybridation appropriees, correspondant aux 
conditions de temperature et de force ionique usuellement 
utilisees par l'homme du metier. 

Preferentiellement , les sondes de 1 ' invention 
sont marquees, prealablement a leur utilisation. Pour 
cela, plusieurs techniques sont a la portee de l'homme 
du metier (marquage fluorescent, radioactif, chimiolumi- 
nescent, enzymatique, etc) . 

Selon un mode de realisation prefere, les 
sondes sont marquees a la digoxigenine . La digoxigenine 
(DIG) est un haptene steroide couple au dUTP pour marquer 
l'ADN utilise comme sonde. Cette technologie est commer- 
cialisee par Boehringer Mannheim. Apres 1 ' hydridation 
avec la sonde et lavage, la detection se realise suite 
a une emission d'un signal chemoluminescent grace au 
substrat disodium 3 - ( 4-methoxyspiro { 1 , 2-dioxethane-3 , 2 ' - 
(5 ' -chloro) tricyclo decan} -4-yl ) phenylphosphate (CSPD) . 

Les sequences nucleotidiques de 1 ' invention 
sont egalement utiles pour la fabrication et 1' utilisa- 
tion d' amorces oligonucleotidiques pour des reactions de 
sequengage ou d ' amplification enzymatique. 

Les techniques d ' amplification enzymatique 
sont principalement illus trees par la PCR. D'autres me- 
thodes similaires peuvent toutefois etre utilisees comme 
par exemple la LCR (Ligase Chain Reaction) , la NASBA 
(Nucleic Acid Sequence Based Amplification) , la Q- 
preplicase, la SDA (Strent Displacement Amplification) 
et toute autre variante comprise dans les connaissances 
technologiques de l'homme du metier. Ces techniques 
d' amplification d'acides nucleiques utilisent des molecu- 
les ' d' amorces oligonucleotidiques pour initier la 
reaction d' elongation de la sequence cible. La longueur 
exacte de ces amorces pourra varier selon les cas . Par 
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exemple, en fonction de la complexite de la sequence de 
la matrice, une amorce polynucleotidique contient 
typiquement de 15 a 25 nucleotides ou davantage. Dans 
certains cas, toutefois, elle peut en contenir moins. 

Pref erentiellement , les amorces nucleotidi- 
ques de 1 ' invention comprennent au moins 19 nucleotides . 
Elles sont consCituees par des amorces choisies sur des 
sequences adjacentes a la region intergenique senX3~ 
regX3 , dans les regions 3' de senX3 et 5 ' de regX3 . 

Selon une variante preferee, on utilise le 
couple d' amorces appelees C5 et C3 , a savoir 5 ' GCGCGA- 
GAGCCCGAACTGC3 ' et 5' GCGCAGCAGAAACGTCAGC3 ' correspondant 
respectivement a 1 ' extremite 3 ' du gene senX3 et 
1 ' extremite 5' du gene regX3 . Ces amorces s'hydrident 
respectivement 5 6 paires de bases en amont de la region 
intercistonique et 62 paires de bases en aval de celle- 
ci . 

Les sequences nucleotidiques et les sondes en 
resultant peuvent etre donees dans des vecteurs de 
clonage et/ou d' expression selon des techniques de 
biologie moleculaire classiques, impliquant notamment 
1 ' utilisation d' enzymes de restriction et de sites de 
coupure specif iques. 

Un vecteur de clonage prefere dans la 
presente invention est represente par le plasmide 
pRegXMtl depose a la CNCM sous le numero 1-1766 dont la 
construction est decrite plus en detail dans les exemples 
ci-apres . 

Un autre vecteur de clonage selon 1 ' invention 
est represente par le plasmide pRegX3Bcl depose a la CNCM 
sous le numero 1-1765. Ces plasmides ont ete chacun 
introduits dans la bacterie E. coli XLl-blue. 

Les vecteurs 1-1765 et 1-1766 contiennent 
chacun les genes complets senX3 ~regX3 avec les regions 
intercistroniques de BCG et de M. tuberculosis respecti- 
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vement . 

Les sequences nucleotidiqu.es selon 1 ' inven- 
tion peuvent par ailleurs etre exprimees dans des 
systemes apropries, pour la production et 1' etude des 
actvites biologiques des peptides correspondants . Dans 
ce cas, celles-ci seront placees sous le controle de 
signaux permettant leur expression dans un note cellulai- 
re . 

Un systeme efficace de production d ' une pro- 
teine ou d ' un peptide recombinant necessite de disposer 
d'un vecteur, par exemple d'origine plasmidique ou 
virale, et d'une cellule hote compatible. 

L'hote cellulaire peut etre choisi parmi des 
systemes procaryotes, comme les bacteries, ou eucaryotes, 
comme par exemple les levures, cellules d'insectes, CHO 
(cellules d'ovaires de hamster chinois) ou tout autre 
systeme avantageusement disponible. 

Le vecteur doit comporter un promoteur, des 
signaux d' initiation et de terminaison de la traduction, 
ainsi que les regions appropriees de regulation de la 
transcription. II doit pouvoir etre maintenu de facon 
stable dans la cellule et peut eventuellement posseder 
des signaux particuliers specifiant la secretion de la 
proteine traduite. 

Ces differents signaux de controle sont 
choisis en fonction de l'hote cellulaire utilise. A cet 
effet, les sequences nucleotidiques selon 1 ' invention 
peuvent etre inserees dans des vecteurs a replication 
autonome au sein de l'hote choisi, ou des vecteurs 
integratifs de l'hote choisi. De tels vecteurs seront 
prepares selon les methodes couramment utilisees par 
1 ' homrae du metier, et les clones en resultant peuvent 
etre introduits dans un hote approprie par des methodes 
standard, telles que par exemple 1 ' electroporation . 

Les methodes de diagnostic ou de detection in 
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vitro dans lesquelles les sondes nucleotidiques obtenues 
a partir des sequences de 1 1 invention sont mises en 
oeuvre, font egalement par tie de la presente invention. 

Plus particulierement , 1 ' invention vise une 
methode de detection de souches de mycobacteries apparte- 
nant au complexe M. tuberculosis dans un echantillon 
biologique comprenant les etapes suivantes : 

(i) mise en contact de 1 ' echantillon biologi- 
que avec un couple d' amorces dans des conditions permet - 
tant une hybridation desdites amorces aux acides nuclei- 
ques specifiques de souches de mycobacteries appartenant 
au complexe M. tuberculosis 

(ii) amplification desdits acides nucleiques; 

(iii) mise en contact d'une sonde nucleotidi- 
que selon 1 ' invention avec ledit echantillon biologique 
dans des conditions permettant la formation de complexes 
d' hybridation entre ladite sonde et les sequences 
d' acides nucleiques amplifies ; 

(iv) detection des complexes d ' hybridation 

formes . 

Selon une premiere variante, la methode selon 
1 ' invention permet de detecter la presence d ' un membre 
quelconque du complexe M. tuberculosis dans un echantil- 
lon biologique. Dans ce cas, les complexes de 1 ' etape 
(iii) definie ci-dessus sont formes avec une sonde 
nucleotidique specif ique de la sequence SEQ ID N * 1 ou 
de son brin complementaire . 

Selon une seconde variante avantageuse, la 
-methode de 1 ' invention permet de specif iquement detecter 
la presence des membres du complexe M. tuberculosis 
autres que le BCG . Selon cette variante, les complexes 
de 1' etape (iii) qui sont detectes sont formes avec une 
sonde nucleotidique specifique de la sequence SEQ ID N° 
2 ou de son brin complementaire, consistant pref erentiel- 
lement en une sequence courte composee de deux fois 9 
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paires de bases encadrant le codon GAG aux positions 40 
a 42 specif ique de la sequence SEQ ID N' 2. 

Selon une troisieme variante particulierement 
avantageuse, la methode de 1 ' invention permet un diagnos- 
tic differential du BCG et des autres membres du 
complexe. Dans ce cas, la methode consiste dans un 
premier temps en une mise en evidence d'acides nucleiques 
specifiques de tous les membres du complexe M. tuberculo- 
sis par detection selon 1 ' etape (iv) des complexes 
d' hybridation formes avec une premiere sonde nucleoti- 
dique specifique de la sequence SEQ ID N' 1 ou de son 
brin complementaire, puis a rechercher parmi les acides 
nucleiques amplifies capables de former des complexes 
avec ladite premiere sonde, ceux qui peuvent egalement 
former des complexes avec une seconde sonde nucleotidique 
specifique de SEQ ID N° 2 ou de son brin complementaire. 

Les sequences d'acides nucleiques amplifies 
hydridant uniquement avec la premiere sonde correspondent 
a des sequences d'acides nucleiques specifiques du BCG, 
alors que les sequences hydridant avec chacune des deux 
sondes correspondent a des sequences des autres membres 
du complexe M. tuberculosis . 

Cette methode de diagnostic differentiel 
offre un interet evident par rapport aux methodes de 
detection classiques, car elle permet de differencier une 
infection par du BCG (issue eventuellement d'une vaccina- 
tion) , de celle par une mycobacterie virulente du 
complexe M. tuberculosis (M. tuberculosis , M. bovis ou 
■M. africanum, et eventuellement M. microti) . Cette 
distinction est particulierement importante chez des 
individus immunodeprimes , notamment des sujets infectes 
par le VIH . 

Selon un autre mode de realisation prefere, 
1' invention fournit une methode d ' identification de 
groupes de mycobacteries appartenant au complexe M. 
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tuberculosis , caracterisee en ce que : 

- on met en contact l'ADN desdites souches 
prealablement extrait avec un couple d' amorces telles que 
definies precedemment , dans des conditions permettant une 

5 hybridation specif ique desdites amorces a leurs sequences 
correspondantes sur l'ADN desdites souches et 1 1 obtention 
de produits d ' amplification, et 

- on mesure la longueur des produits d' ampli- 
fication obtenus, par exemple par electrophorese en gel 

10 d' agarose. 

Avantageusement , on utilise dans cette 
methode les amorces 5 ' GCGC GAGAGC CCG AAC TGC 3 ' et 5 ' GCGCAG- 
CAGAAACGTCAGC3 ' . 

L' invention concerne egalement une trousse 
15 pour 1 ' identification in vitro de souches de mycobacte- 
ries appartenant au complexe M. tuberculosis dans un 
prelevement biologique comprenant : 

- un couple d' amorces selon 1 ' invention, 
comme definies precedemment ; 

2 0 - les reactifs necessaires pour permettre 

1 ' amplification des sequences d'acides nucleiques 
specifiques de souches appartenant au complexe M. 
tuberculosis a 1 ' aide desdites amorces, 

- eventuellement des moyens pour reveler les 

2 5 fragments amplifies, pref erentiellement une sonde nucleo- 

tidique de 1' invention. 

D'autres caracteristiques et avantages de 
1' invention sont illustres par les exemples dans la suite 
_„de la description ainsi que par les figures dont les 

3 0 legendes sont indiquees ci-apres. 

Figure 1 : Analyse par "Southern blot" de 
l'ADN de BCG (IPP). A). Le fragment de 259 paires de 
bases comprenant une partie du gene regX3 a ete utilise 
3 5 comme sonde pour detecter le gene dans differents 
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fragments de restriction dans 1 ' ADN chromosomique du 
BCG(IPP). Les enzymes de restrictions utilises sont 
indiques en haut de la figure. 

B) . Carte de restriction partielle du locus des genes 
5 senX3 et regX3 du BCG (IPP) . Les sites de restrictions 
sont indiques par rapport aux genes senX3 et regX3 , ainsi 
que la sonde utilisee. 

Figure 2 : Sequence nucleotidique des genes 
senX3 et regX3 du BCG (IPP) et sequences proteiques 

10 derives. Les f leches indiquent des sequences palindromi- 
ques . La sequence Shin-Dalgarno putative est soulignee 
en pointilles (SD) . La sequence transmembranaire predite 
de SenX3 est doublement soulignee. Les regions de SenX3 
conservees chez d'autres senseurs sont soulignees et 

15 annotees : H, region contenant l'histidine modif iee; N, 

region riche en asparagine; F, region riche en phenylala- 
nine; Gl et G2 , regions riches en glycine. Les petites 
fleches verticales indiquent les residus predits pour 
etre phosphoryles . La sequence annotee PgmY indique la 

20 fin du gene codant la phosphoglycerate mutase. 

Figure 3 : Profil d ' hydrophobic ite de SenX3 . 
Les valeurs positives indiquent des regions hydrophobes 
et les valeurs negatives indiquent les regions hydrophi- 
les. Les fleches indiquent les codons d' initiation 

25 possibles et les deux lignes horizontales indiquent les 
regions transmembr ana ires predites . Les chiffres au haut 
de la figure indiquent les numeros des acides amines. 

Figure 4 : Comparaison de la region intercis- 
__tronique entre le BCG (IPP) et M. tuberculosis (IPL). 

3 0 Les genes senX3 et regX3 sont indiques par les fleches. 

Les sequences nucleotidiques sont indiquees ainsi que les 
sequences proteiques deduites . 

Figure 5 : Analyse par Southern blot d'ADN de 
M. tuberculosis et de BCG. L ' ADN chromosomique de M. 

3 5 tuberculosis (IPL) (a droite) et de BCG (IPP) (a gauche) 
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a ete digere par PstI, soumis a electrophorese en agarose 
et analyse par hybridation avec la sonde intergenique 
senX3-regX3 de M. tuberculosis (I PL) . 

Figure 6 : Analyse par electrophorese en 
agarose (2,5%) des produits obtenus par PCR realisee sur 
differentes souches mycobacteriennes . Pistes 1 a 3 : 
groupe 1, respect ivement M. microti, M. tuberculosis 
V808, M. tuberculosis V761; pistes 4 et 5 , groupe 2, 
respectivement M. tuberculosis V729, M. bovis 60; pistes 
6 a 8, groupe 3, respectivement M. bovis 63, M. bovis 78 
et M. bovis AN5 ; pistes 9 et 10, groupe 4, respective- 
ment M. tuberculosis H37Ra (IPL) et M. tuberculosis H37Rv 
(IPP) ; pistes 11 et 12, groupe 5, respectivement M. 
tuberculosis (IPL), M. bovis 76; pistes 13 et 14, groupe 
6, respectivement M. bovis (BCGite 29) et M. bovis BCG 
(IPP); piste 15, groupe 7, M. tuberculosis N° 19. 

Figure 7 : Analyse par Southern blot des 
fragments obtenus dans la figure 6. La sonde utilisee est 
la region intercistronique senX3-regX3 de M. tuberculo- 
sis(IPL) . 

EXEMPLES 

EXEMPLE 1 : Carte genomique et clonage des 
genes senX3-regX3 de M. bovis BCG (IPP) , codant pour le 
systeme a deux composants mycobacterien . 

Wren et al . (1992) ont amplifies un fragment 
_de 259 paires de base provenant du gene de M. tuberculo- 
sis (IPL) qu'ils ont appele regX3 . 

Les auteurs de la presente invention ont 
amplifies la sequence correspondante a partir de M. bovis 
BCG (souche vaccinale 117 3 P2, obtenue a la collection WHO 
de Stockholm, Suede) en utilisant les oligonucleotides 
synthetiques suivants : 5 ' -CGAGGAGTCGCTGGCCGATCCGC- 3 ' et 
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5 1 -AGCGCCCCAGCTCCAGCCGACC-3 ' . L ' amplification a ete 
realisee en utilisant ces amorces et une polymerase Deep 
Vent (New England Biolabs) . Le produit d ' amplification 
de 259 paires de base resultant a ensuite ete purifie par 
electrophorese sur gel d' agarose puis sous-clone dans le 
site Smal du vecteur pBluescript KS+ (Stratagene) selon 
des protocoles standards (Sarabrook et al . , 1989). Cet 
insert a ensuite ete retire du plasmide recombinant par 
digestion avec BamHI et BcoRI puis marque avec du dCTP[a- 
32 P] par "random priming" (marquage au hasard) en utili- 
sant le kit de "random priming" commercialise par 
Boehringer selon les conditions recommandees par le 
fabricant. L ' ADN genomique de M. bovis BCG (IPP), mis en 
culture dans du milieu de Sauton (Sauton, 1912) a 37oc 
dans des flacons pour culture stationnaire de tissus, a 
ete extrait comme decrit auparavant (Kremer et al . , 
1995a) et digere par differentes enzymes de restriction. 
Cet ADN a ensuite ete soumis a une electrophorese sur gel 
d' agarose et a une analyse par Southern Blot selon les 
methodes standards (Sambrook et al . , 1989) . Le sondage 
de l'empreinte avec de I'ADN marque au [ 32 P] a montre 
qu'une digestion par Kpnl avec soit BamHI, EcoRI ou Psfcl, 
produisait des paires de bandes hybridantes, avec une 
bande marquee de fagon plus intense que 1 ' autre dans 
chacune des paires (fig. Ia) . Ces bandes ont ete attri- 
butes aux sequences 5' et 3' respect ivement , du site Kpnl 
asymetrique unique de la sonde. Ceci a permis de locali- 
ser les sites 5' et 3 ' BamHI, EcoRI et PstI du site Kpnl 
{fig. Ib) . Les digestions avec uniquement PstI ont donne 
une seule bande d ' hybridation . Comme cela pouvait etre 
prevu, la digestion avec Knpl a donne deux bandes et la 
digestion avec BamHI et EcoRI a conduit a 1 ' obtention 
d'une seule bande d" environ 3,5 kb. 

L'ADN genomique du BCG a ete digere avec 
BamHI et EcoRI, et des fragments d ' ADN de 3 a 4 kb ont 
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ete isoles apres une electrophorese sur gel d' agarose. 
Ces fragments ont ete inseres dans pBluescript SK- 
(Stratagene) restreint par BamHI et EcoRI . 900 clones 
recombinants ont ete cribles avec la sonde marquee au 
5 [ 32 P] par la technique standard dite de "colony blot 
hybridization" (Sambrook et al . , 1989). Trois d'entre eux 
etaient positifs et se sont averes contenir le meme 
insert d'ADN de 3,2 kb BamHI/EcoRI par analyse de 
restriction. Un clone hybridant a ete isole pour des 
10 etudes ulterieures et a ete denomme pRegX3Bcl (1-1765). 

EXEMPLE 2. : Sequence des genes de M. bovis 
BCG (IPP) codant pour le systeme a deux composants 

15 Les fragments Sail de 1,0, 1,5 et 0,7 kb ont 

ete isoles de 1 ' insert de 3,2 kb de pRegX3Bcl (1-1765), 
et sous- clones dans pBluescript SK- . La sequence de 
1 ' insert de 3 , 2 kb, ainsi que celle des sous-clones Sail 
a ete determinee sur les deux brins par la methode de 

20 "primer walking". La sequence nucleotidique de 3208 pb 
de M. bovis BCG (IPP) (Fig. 2) a demontre la frequence 
de C + G caracteristique des mycobacteries (66,6 %) . Deux 
principaux cadres de lecture ouverts (ORF, Open Reading 
Frame) designes par regX3 et senX3 , ont ete identifies 

2 5 (Fig. Ib et 2) . Le gene regX3 demarre par un triplet ATG 

a la position 1679 et se termine par un triplet TAG a la 
position 2360. II contient la sequence de la sonde 
marquee au 32 P et code pour une proteine dont la sequence 
._en acides amines deduite est de 227 residus pour une 
30 masse moleculaire calculee de 24 881 Da. La limite en 
araont de 1 ' ORF senX3 n'est pas certaine parce que cinq 
codons d' initiation potentiels en phase (ATG ou GTG) ont 
ete trouves sur une courte distance (de 296 a 446) (Fig. 
2 et 3). Toutefois, seul le GTG a la position 296 est 

3 5 precede a 9 nucleotides en amont, par une sequence 
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homologue a la sequence de Shine-Dalgarno de Escherichia 
coli (4 des 6 residus sont identiques a AGGAGG) . Done, 
ce codon GTG pourrait etre la limite en 5' de I'ORF senX3 
qui se termine avec le codon stop TGA a la position 1526. 
Cet ORF est done presume coder pour une proteine de 44769 
Da composee de 410 residus d'acides amines. Le gene senX3 
est precede a 273 nucleotides en amont par la partie 3 ' 
d ' un ORF codant un homologue des phosphoglycerate 
mutases . Une sequence susceptible de former une structure 
en epingle a cheveux est localisee entre les positions 
178 et 194. Cette sequence pourrait fonctionner comme une 
sequence terminatrice de transcription de l'ORF en amont. 

Une recherche sur banque de donnee MycDB a 
revele que les genes senX2 et regX3 sont aussi presents 
chez M. leprae. Les produits qu'ils codent sont similai- 
res respectivement a 82,7 % et 94,9 % aux proteines senX3 
et RegX3 de M. bovis (IPP). L'ORF senX3 de M. leprae 
s'avere etre initie par un codon GTG et est precede par 
un ORF codant pour un homologue de phosphoglycerate 
mutase, similaire a celui qui a ete trouve chez M. bovis 
BCG ( IPP) . 

EXEMPLE 3 : Clonage et sequencage des genes 
senX3-regX3 de M. tuberculosis {IPL) . 

Les genes senX3 et regX3 de M. tuberculosis 
(IPL) ont ete clones par PCR a partir d'ADN chromosomique 
de M.. tuberculosis 22962067, un isolat clinique de la 
collection de mycobacteries de l'Institut Pasteur de 
Lille. L'ADN de M. tuberculosis (IPL) a ete extrait par 
la methode decrite precedemment pour 1' extraction d'ADN 
chromosomique du BCG (Kremer et al . , 1995a) . Le fragment 
de 2,2 kb contenant les genes senX3 et regX3 de M. 
tuberculosis (IPL) a ete amplifie par PCR en utilisant 
les amorces suivantes, homologues aux sequences adjacen- 
tes des genes senX3 et RegX3 de M. bovis BCG (IPP): 5'- 
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TGGCGTAGTGTGTGACTTGTC - 3 ' et 5 ' - GACCAGACAGTCGCCAAGGTT - 3 ' . 
Le fragment amplifies a ete clone dans le site Smal de 
pBluescript SK- (version II) pour produire un plasmide 
denomme pRegX3Mtl (1-1766). Le fragment total de 2,2 kb 
5 a ensuite ete sequence en utilisant la meme strategie que 
celle decrite dans 1 ' exemple 2 pour les' genes senX3 et 
regX3 du BCG (IPP) . La sequence d'ADN des ORF senX3 et 
regX3 de M. tuberculosis (IPL) ainsi que la region 5' en 
amont de senX3 et la region 3 ' en aval de RegX3 etaient 
10 identiques a celles du BCG (IPP) . Toutefois, la region 
intercistronique entre senX3 et i?egX3 demontrait des dif- 
ferences interessantes qui sont etudiees dans 1 ' exemple 
ci-apres . 

15 EXEMPLE 4 : Analyse de la region intercistro- 

nique senX3-regX3 . 

La region intercistronique entre senX3 et 
RegX3 contient une parfaite duplication de 77 paires de 
20 bases en tandem chez le BCG (IPP) (fig. 4). Chaque 
sequence repetee contient un court ORF qui a la capacite 
de coder pour un peptide de 25 acides amines. Le codon 
d' initiation ATG que 1 ' on peut deduire de la premiere 
repetition chevauche le codon stop TGA de senX3 . Cette 

2 5 sequence repetee se termine par deux codons stop en 

phase, qui chevauchent le codon d' initiation ATG deduit 
de la repetition suivante . L ' ORF de la seconde repetition 
se termine aussi par un double codon stop TGA, qui 
.-chevauche le codon start ATG de regX3 . 

3 0 La region intercistronique de M. tuberculosis 

(IPL) est plus longue et contient une troisieme sequence 
repetee qui toutefois n'est pas complete. Elle contient 
une courte deletion interne en phase des nucleotides 40 
a 66 qui sont remplaces par GAG. L'ORF de cette troisieme 
3 5 repetition se termine aussi par un double codon stop 
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chevauchant le codon ATG de regX3 . 

La sequence de la region intercistronique de 
M. leprae est plus courte que celle du BCG (IPP) . Elle 
contient 52 paires de bases. 

L ' existence de ces structures en repetition 
dans la region intercistronique senX3-regX3 a conduit les 
inventeurs a rechercher si elles etaient presentes dans 
d'autres regions de M. tuberculosis (IPL) ou dans le 
chromosome de M. bovis BCG (IPP) par analyse par Southern 
Blot. La region intercistronique serzX3 -:regX3 de M. 
tuberculosis (IPL) a ete obtenue par digestion enzyma- 
tique de pRegX3Mt2 avec EcoRI et BamHI . Le fragment d'ADN 
de 491 paires de bases resultant a ete ensuite digere 
avec BsrI-AluI pour produire un fragment d'ADN de 218 
paires de bases qui correspond au fragment intergenique 
senX3-regX3 de M. tuberculosis (IPL). Ce fragment d'ADN 
a ensuite ete marque au hasard avec de la digoxigenine- 
dUTP (kit cat. No 1093 657) selon les recommandations du 
fabricant (Boehringer Mannheim) . pRegX3Mt2 a ete produit 
par une premiere amplification par PCR d'un fragment 
d'ADN chromosomique de 471 paires de bases de M. tubercu- 
losis 22962067 (IPL) en utilisant les oligonucleotides 
suivants : 5 ' AAACACGTCGCGGCTAATCA 3' et 

5 ' CCTCAAAGCCCCTCCTTGCGC 3' et le fragment amplifie 
resultant a ensuite ete clone dans le site SmaT de 
pBluescript KS- . 

L'ADN chromosomique de M. tuberculosis (IPL) 
a ensuite ete totalement digere avec PstI et soumis a une 
electrophorese sur gel d 1 agarose et analyse par Southern 
blot selon les procedures habituelles (Sambrook et al., 
1989) . La sonde marquee a ensuite ete utilisee pour une 
hybridation coitune indique ci-apres . 

La sonde a d'abord ete denaturee par ebulli- 
tion pendant 5 minutes, et la membrane a ete incubee avec 
la sonde pendant la nuit a 68oC, apres une prehybridation 
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pendant deux heures a 680C. Le tampon utilise pour la 
prehybridation et 1 ' hybridation etait du 5xSSC {Sambrook 
et al., 1989), 0,1% de N-laurylsarcosine (p/v) ; 0,02 % 
de SDS (p/v) ; 1 % de reactif bloquant (Boehringer 
5 Mannheim) . La membrane a ensuite ete lavee deux fois 
pendant cinq minutes dans du 2xSSC (Sambrook et al . , 
1989) et 0,1 % de SDS a temperature ambiante et deux fois 
pendant 15 minutes dans du 0,lxSSC, 0,1 % SDS a 68oc. Les 
sondes hybridees ont ensuite ete immunodetectees avec des 

10 fragments Fab antidigoxigenine conjugues a la phosphatase 
alcaline et un substrat CSPD chimioluminescent (Boehrin- 
ger Mannheim) . 

Comrae on peut le voir sur la figure 5, 
differentes copies de la region intercistronique senX3- 

15 regX3 sont presentes chez M. tuberculosis (IPL) , ainsi 
que chez M. bovis BCG (IPP) . 

EXEMPLE 5 : Amplification par PCR de la 
region intercistronique senX3-regX3 de differentes 

2 0 souches de mycobacteries. 

Etant donne que la region intercistronique 
separant les genes senX3 et regX3 presente des variations 
de longueur entre M. bovis BCG (IPP) , M. tuberculosis 
25 (IPL) et M. leprae, les auteurs de la presente invention 

ont analyse la region correspondante chez d'autres 
souches de M. bovis (y corapris des souches non BCG) et 
de M. tuberculosis . lis ont egalement analyse d'autres 
._especes de mycobacteries : (i) les autres membres du 

3 0 complexe M . tuberculosis : M. africanum et M. microti et 

(ii) les mycobacteries autres que celles du complexe M. 
tuberculosis . 

Les souches analysees sont indiquees dans les 
tableaux 1 et 2 . Leur ADN chromosomique a ete prepare 
3 5 comme indique ci-apres. Les mycobacteries ont ete recupe- 
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rees par centrif ugation (3000 tours/min ; 30 minutes) , 
a partir de 100 ml de culture et raises en incubation 
pendant 1 heure a 3 7oC dans 10 ml de tampon phosphate 
(saccharose 0,4 M, EDTA 10 mM, Tris-HCl (pH 8,) 10 mM, 
4 mg/ml de lysozyme) . Les protoplastes obtenus ont ete 
recuperes par centrif ugation (3000 tours/min ; 20 
minutes) puis lyses en les mettant a incuber pendant 1 
heure a 60oC dans 6 ml de tampon L (NaCl 10 mM, SDS 6 %, 
Tris-HCl (pH 8) 10 mM, 500 ug/ml de proteinase K) . Apres 
addition de 1,5 ml de NaCl 5 M, le melange a ete centri- 
fuge (14 000 tours/min., 20 minutes). Le surnageant a ete 
soumis a une extraction au phenol-chlorof orme et l'ADN 
a ete precipite a 1 ' isopropanol . Le culot remis en 
suspension a ensuite ete traite par la RNAse, extrait 
avec du phenol-chlorof orme et du chloroforme puis preci- 
pite avec de l'ethanol. Le culot a ete ensuite seche a 
1 ' air et remis en suspension dans 100 ul de tampon TE (10 
mM Tris-HCl, ImM EDTA, pH 7,6). 

Les amorces pour analyse par PCR ont ete 
choisies a partir de la sequence d ' ADN des genes senX3 
et RegX3 de M. bovis BCG (IPP) et M. tuberculosis (IPL) . 
Une amorce (C5) hybridait a 1 ' extremite 3' du gene senX3 
et avait la sequence 5 ' -3 ' suivante 
5 ' GCGCGAGAGCCCGAACTGC3 ' . L ' autre amorce (C3) hybridait 
a 1' extremite 5' du gene RegX3 et avait la sequence 5 ' -3 ' 
suivante : 5 1 -GCGCAGCAGAAACGTCAGC-3 ' . Avec ces deux 
amorces, le produit de PCR comprend 5 6 paires de bases 
additionnelles a 1 ' extremite 5 ' de la region intergenique 
•et 62 paires de bases additionnelles a son extremite 3' 
par rapport a la region intercistronique . Le produit de 
PCR a une longueur de 3 69 paires de bases pour M. 
tuberculosis 22962067 (IPL) et 276 paires de bases pour 
M. bovis BCG (IPP) . 

Les amplifications par PCR ont ete realisees 
dans un termocycleur (Perkin Elmer) par incubation de 1 
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ul d'ADN chromosomique avec le melange reactionnel 
suivant : oligonucleotides C5 et C3 (1 ug/lul de chaque) , 
dTNP (2 ul) 2 5 mM, TMAC1 (chlorure de tetramethylammo- 
nium) (2 ul) 5 mM, tampon enzymatique 10 x (10 pi) , ADN 
5 polymerase Vent (1 U/0,5 ]il) , eau (82 ul) . 

L ' amplification a ete realisee sur 30 cycles a 94oc 
pendant une minute, 65oc pendant une minute et 72 oc 
pendant une minute. 10 ul de produit de PCR ont ensuite 
ete soumis a une electrophorese sur gel d' agarose a 2,5 

10 % et visualises avec du bromure d'ethidium. Les controles 
negatifs con tenant tous les reactifs de PCR excepte la 
matrice d'ADN, ont ete traites en parallele avec les 
echantillons . La longueur du produit de PCR a ete estimee 
par comparaison avec l'echelle d'ADN de 1 kb. 

15 Aucun produit de PCR n'a ete detecte pour les 

11 souches de mycobacteries non tuberculosis testees. 
(voir tableau 2) . Trois souches de Streptomyces (S. 
cacaoi, S. R61 et S. R39), ainsi que E. coli TGI ont 
egalement donne des resultats negatifs en PCR. En 

2 0 revanche, des produit s de PCR ont ete obtenus avec tous 

les membres du complexe M. tuberculosis . La specif icite 
des produits de PCR a ete confirmee dans tous les cas par 
analyse par Southern Blot en utilisant en tant que sonde 
la region intergenique senX3-regX3 de M. tuberculosis 
25 (IPL) marquee a la digoxigenine , comme decrit a 1 1 exemple 

4 . 

La longueur des fragments amplifies est 
indiquee dans le tableau 3. Huit groupes differents avec 
— des longueurs d'amplicon differentes ont ete obtenus. sur 
30 les 35 isolats cliniques de M. tuberculosis testes, 34 
ont donne des fragments de PCR de 329 paires de bases qui 
ne pouvaient etre distingues de celui obtenu avec la 
souche reference M. tuberculosis 22962067 (IPL) (groupe 
5) . Une souche de M. tuberculosis (No 19) a donne un 

3 5 produit de PCR de 2 54 paires de bases (groupe 8) . M. 
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tuberculosis S200 appartient aussi au groupe 5. 

Des souches de M. tuberculosis provenant du 
Vietnam et ne contenant pas la sequence IS6110 (V. 808, 
V. 761 et V.729) etaient differentes du groupe majeur M. 

tuberculosis (groupe 5) . La longueur de leur produit de 
PCR depassait de 500 paires de bases (un produit de +/- 
50 0 paires de base et deux de 560) . Les souches de 
laboratoire de M. tuberculosis H37Ra et H3 7Rv avaient des 
produit s de PCR legerement plus grands que ceux obtenus 
dans le groupe 5 des souches de M. tuberculosis et ces 
deux souches sont classees parmi le groupe 4 . Ces deux 
souches sont particulieres en ce qui concerne la pathoge- 
nicity incertaine pour H37Rv et la perte de pathogenicity 
de H3 7Ra. Par ailleurs, aucun cas clinique de M. tubercu- 
losis n'etait present dans les groupes 4, 6, 8; ces trois 
groupes sont done specifiques pour les souches non- 
virulentes . 

Les souches BCG (souches vaccinales et 
isolats de cas cliniques de BCGites) ont ete divisees en 
trois groupes (N° 4, 6 et 8) . Les produits de PCR obtenus 
a partir de ces souches avaient une longueur de 3 53 
paires de base, 276 et 199, respectivement . 

La variability la plus importante au niveau 
de la longueur des fragments de PCR etait rencontree pour 
les souches de M. bovis non BCG. Six souches ont ete 
testees. Trois d'entre elles, y compris la souche refe- 
rence AN5, ont donne des produits de PCR de 406 paires 
de bases (groupe 3). Les trois autres souches ont ete 
regroupees dans les groupes 2, 5 et 7 correspondant a des 
fragments de PCR d' environ 500 et de 329 ou 254 paires 
de bases respectivement. 
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Tableau 1 : Complexe M. tuberculosis 





Especes 


Souches 


Sources 




M .tuberculosis 


- reference (22962067) 


- IPL* 


5 




- H37Ra 


_ rpp** 






- H37Rv 


- IPP (Marchal) 






- S200 


- CHR de Lille*** 






- 35 isolats cliniques 


- CHR de Lille 






(differents profils de IS6110 




10 




RFLP) 








- 3 isolats cliniques du Viet- 


- IPP (Marchal) 






nam : V808, V761, V729 




15 


M. bovis 


- BCG (souches vaccinates): 


- IPP 






BCG IPP 


- IPL 






BCG Moreau 


- IPL 






BCG Japonicus 


- IPP 






BCG Pragues 


- IPP 


20 




BCG Montreal 


- IPP 






BCG Russe 


- IPP 






BCG Glaxo 








- cas de BCGites : 








4 isolats cliniques (28, 29 


- IPL 


25 




30, 31) 


- CHR de Lille 






- non BCG : 








reference ANS 


- IPP (Marchal) 














2 isolats de chevres (60, 63) 


- Universite de Zara- 


30 




2 isolats de vaches (76, 78) 


goza (Martin) 








- Universite de Zara- 




M. africanum 


- isolat clinique 


goza (Martin) 




M. microti 


- reference ATCC 19422 


- CHR de Lille 








- IPP (Marchal) 
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Tableau 2 : Mycobacteries atypiques 





1 " . 

1 Especes ct Souches 


Sources 


5 


M. aurum 


- isolats cliniques (IPL) 




M. avium 


- isolats cliniques (IPL) 




M. chelonae 


- isolats cliniques (IPL) 




M. flavescens 


- isolats cliniques (IPL) 




1 M. fortuitwn 


- isolats cliniques (IPL) 


10 


M. kansasii 


- isolats cliniques (CHR de Lille) 




M. marinum 


- isolats cliniques (IPL) 




M. scrofulaceum 


- isolats cliniques (IPL) 




M. smegmatis 


- IPL 




M. terae 


- isolats cliniques (IPL) 


15 


M. xenopi 


- isolats cliniques (IPL) 
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Tableau 3 : Amplification par PCR de la region intergenique senX3-regX3 et 
sequencage 



5 




Souches de Mycobacteria 


Longueur estimee du 
produit obtenu iors de la 
PCR 


Composition 
de la region intergenique 
senX3-regX3 


10 


i 


- M, microti 

- M. tuberculosis: - V.808 

- V.761 


560 pb 


77 77 77 77 77 53 




~2 


- M. tuberculosis V. 729 

- M. bovis 60 (chevre) 


± 500 pb 




15 




- M. bovis:- 63 (chevre) 

- 78 (vache) 

- AN5 


406 pb 


77 77 77 53 


20 


4 


- M. tuberculosis H37Rv (IPP) 

- M. tuberculosis H37Ra (EPL) 

- BCG: - BCG Japonicus 

- BCGite 28 

- BCGite 30 


353 pb 


77 77 77 


25 


T 


- M. africamim 

- M. bovis 76 (vache) 

- M. tuberculosis: 

-rtffr?n«f<i?riPL 

-S200 

- 34 isolate cliniques. 


329 pb 


77 77 53 


30 
35 


"? 


- BCG: - reference de I'IPP 

- BCG Moreau 

- BCG Russe 

- BCG Glaxo 

- BCGite 29 

- BCGite 3 1 




77 77 




7 


- M. bovis 1 

- M, tuberculosis n°19): un 
des 35 isolats cliniques du 
CHR de Lille testes 


254 pb 


77 53 


40 


T 


- BCG: - BCG Pragues 
- BCG Montreal 


199 pb 


77 



45 

Les fragments d'ADN amplifies comprennent la region 
intercistronique senX3-regX3 ainsi que 56 paires de bases en amont de celle-ci et 
62 paires de bases en aval. Les fleches 77 et 53 designent les elements repetes 
trouves dans chaque groupe. Les souches pour lesquelles la region intercistronique 
5 0 a ete sequencee sont soulignees. 
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SEQ ID N° 1 : 77 paires de bases : 

atg acc tgc gcc gac gac gat gca gag cgt age gat gag gtg 
ggg gca cca ccc get tgc ggg gga gag tgg cgc tg 

SEQ ID N° 2 : 53 paires de bases : 

atg acc tgc gcc gac gac gat gca gag cgt age gat gag gag 
gag tgg cgc tg 
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REVINDICATIONS 

1. Fragment d'acides nucleiques specif ique de 
mycobacteries appartenant au complexe M. tuberculosis , 
comprenant un enchainement de nucleotides choisi parmi 
la sequence SEQ ID No l, la sequence SEQ ID NO 2, leurs 
sequences complementaires ou les sequences d'acides 
nucleiques capables de s'hybrider a 1 ' une des sequences 
precedentes dans des conditions de stringence adequates. 

2. Fragment d'acides nucleiques specif ique du 
complexe M. tuberculosis , comprenant un enchainement de 
nucleotides choisi parmi la sequence SEQ ID NO l, S a 
sequence complementaire ou les sequences d'acides nuclei- 
ques capables de s'hybrider a 1 ' une des sequences 
precedentes dans des conditions de stringence adequates. 

3. Fragment d'acides nucleiques specif ique de 
membres du complexe M. tuberculosis differents du BCG 
comprenant un enchainement de nucleotides choisi parmi 
la sequence SEQ ID NO 2, sa sequence complementaire ou 
les sequences d'acides nucleiques capables de s'hybrider 
a 1' une' des sequences precedentes dans des conditions de 
stringence adequates. 

4. Vecteur de clonage et/ou d' expression 
contenant une sequence d'acides nucleiques selon la 
revendication 1. 

5. Vecteur selon la revendication 4, caracte- 
rise en ce qu'il s ' agit du plasmide pRegX3Bcl ou 
PRegX3Mtl respect ivement deposes a la CNCM sous les 
numeros 1-1765 et 1-1766. 

6. Sonde nucleotidique ou amorce nucleotidi- 
que caracterisee en ce qu'elle hybride specif iquement 
avec 1 ' une quelconque' des sequences selon la revendica- 
tion 1, les sequences d'ARN correspondantes ou les genes 
correspondants . 
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7. Sonde nucleotidique selon la revendication 
6, cornprenant 24 nucleotides consecutifs choisis parmi 
les sequences d'acides nucleiques selon la revendication 
1. 

8. Sonde nucleotidique selon la revendication 
6, caracterisee en ce qu'elle comprend la sequence SEQ 
ID NOl ou son brin complementaire. 

9. Sonde nucleotidique selon la revendication 
6, caracterisee en ce qu'elle comprend deux sequences SEQ 
ID N° 1 successives, suivies d'une sequence SEQ ID N° 2. 

10. Sonde nucleotidique pour la detection de 
sequences d'acides nucleiques specif iques de merabres du 
complexe M. tuberculosis differents du BCG, caracterisee 
en ce qu'il s 1 agit d'une sequence correspondant a la 
region de la sequence SEQ ID N° 2 encadrant le codon GAG 
aux positions 40 a 42 ou de son brin complementaire. 

11. Sonde nucleotidique selon la revendica- 
tion 10, caracterisee en ce qu'il s ' agit d'une sequence 
composee de 9 paires de bases en amont et 9 paires de 
bases en aval du codon GAG aux positions 40 a 42 speci- 
fique de la sequence SEQ ID N° 2. 

12. Sonde nucleotidique selon la revendica- 
tion 10, caracterisee en ce qu'il s ' agit de la sequence 
SEQ ID N° 2 ou de son brin complementaire. 

13. Sonde nucleotidique selon la revendica- 
tion 6, caracterisee en ce qu'elle est marquee par la 
digoxigenine . 

14. Amorces nucleotidiques pour 1' amplifica- 
tion d'une sequence nucleotidique specif ique de mycobac- 
teries appartenant au complexe M. tuberculosis, cornpre- 
nant des sequences nucleotidiques correspondant aux 
sequences adjacentes a la region intergenique senX3- 
regX3, dans les regions 3' de senX3 et 5' de regX3 . 

15. Amorces selon la revendication 14, 
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caracterisees en ce qu'elles comprennent 19 nucleotides. 

16. Amorces selon la revendication 14, 
caracterisees en ce qu'il s'agit du couple d' amorces 
5 ' GCGCGAGAGCCCGAACTGC 3 ' et 5 ' GCGCAGCAGAAACGTCAGC3 ' . 

17. Utilisation d'une sequence selon la 
revendication 1, pour la realisation de sondes nucleoti- 
diques de diagnostic ou d' amorces nucleot idiques utilisa- 
bles dans une methode d ' amplification enzymatique. 

18. Utilisation d'une sonde selon 1 * une 
quelconque des revendications 6 a 13 come outil de 
detection ou de diagnostic in vitro de souches de 
mycobacteries appartenant au complexe M. tuberculosis . 

19. Methode de detection de souches de 
mycobacteries appartenant au complexe M. tuberculosis 
dans un echantillon biologique, comprenant les etapes 
suivantes : 

(i) mise en contact de 1 ' echantillon biologi- 
que avec un couple d' amorces selon l'une quelconque des 
revendications 6, 14 a 16 dans des conditions permettant 
une hybridation desdites amorces aux acides nucleiques 
specifiques de souches de mycobacteries appartenant au 
complexe M. tuberculosis 

(ii) amplification desdits acides nucleiques; 

(iii) mise en contact d'une sonde nucleotidi- 
que selon l'une quelconque des revendications 6 a 13 avec 
ledit echantillon biologique dans des conditions permet- 
tant la formation de complexes d ' hybridation entre ladite 
sonde et les sequences d' acides nucleiques amplifies ; 

(iv) detection des complexes d ' hybridation 

formes . 

20. Methode selon la revendication 19, 
caracterisee en ce que l'etape (iii) est realisee avec 
une sonde nucleot idique selon la revendication 8. 

21. Methode de detection de la presence de 
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raembres du complexe M. tuberculosis autres que le BCG 
dans un echantillon biologique selon la revendication 19, 
caracterisee en ce que 1 ' etape (iii) est realisee avec 
une sonde nucleotidique selon la revendication 10. 

22. Methode de detection et de diagnostic 
differentiel du BCG et des autres membres du complexe M. 
tuberculosis dans un echantillon biologique, caracterisee 
en ce qu ' on realise une methode de detection selon la 
revendication 20 et en ce que 1'on recherche parrai les 
acides nucleiques amplifies capables de former des 
complexe d 1 hybridation, ceux qui sont egalement capables 
de former des complexes d ' hybridation avec une sonde 
nucleotidique selon la revendication 10. 

23. Methode selon la revendication 21 ou la 
revendication 22 pour differencier une infection par le 
BCG d'une infection par une mycobacterie virulente du 
complexe M. tuberculosis chez un sujet immunodeprime. 

24. Methode selon la revendication 23, 
caracterisee en ce que le sujet immunodeprime est un 
sujet infecte par le VIH. 

25. Methode pour 1 ' identification de groupes 
de mycobacteries appartenant au complexe M. tuberculosis, 
caracterisee en ce que : 

- on met en contact l'ADN desdites souches 
prealablement extrait avec un couple d' amorces selon 
1 ' une quelconque des revendications 6, 14 a 16, dans des 
conditions permettant une hybridation specifique des 
amorces a 1 1 une des sequences selon la revendication 1 
et l'obtention de produits d ' amplification, et 

- on mesure la longueur des produits d 1 ampli- 
fication obtenus. 

26. Methode selon la revendication 25, 
caracterisee en ce que 1 ' on utilise le couple d' amorces 
selon la revendication 16. 

27. Trousse pour 1 ' identification In vitro de 



#2752425 

souches de mycobacterias appartenant au complexe M. 
tuberculosis dans un prelevement biologique comprenant: 

- un couple d ' amorces selon 1 ' une quelconque 
des revendications 6, 14 a 16 ; 

- les reactifs necessaires pour permettre 
1 * amplification des sequences d'acides nucleiques 
specifiques de souches appartenant au complexe M. 
tuberculosis a 1 ' aide desdites amorces, 

- eventuellement des moyens pour reveler les 
fragments amplifies. 
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GAATTCCGCTGCGCTACGACCTGGATTCCGCGATGAGGCCGCTGGTGCGCGGTGG 55 

I PLRYDLDSAMRPLVRGG 
-> PgmY 

TACGTATCTGGACCCGGAGGCGGCAGCCGCCGGCGCCGCCGCGGTGGCCGGCCAGGGCCG 115 
TYLOPEAAAAGAAAVAGQGR 



CGGGTAATTGTTTGAGATCCCACCTGCCGGCGGTTTCGGCGGCTGATGGTGTGCTTTGGT 175 
G 

». < 

GCGCTGTTTGCCAAACAGC ATGTGAACGGT AACCGAACAGCTGTGGCGTAGTGTGTGACT 235 
TGTCCGATTTTGGCCTTGCCGCGCTAGGGCGACGTTCACCGGATTTGTAGGATTTTCCTT 295 

""sb"" 

GTGACTGTGTTCTCGGCGCTGTTGCTGGCCGGGGTTTTGTCCGCGCTGGCACTGGCCGTC 355 
MTVFSALLLAGVLSALALAV 2<? 
S«nX3 -> 

GGTGGTGCTGTTGGAATGCGGCTGACGTCGCGGGTCGTCGAACAGCGCCAACGGGTGGCC 415 
GGAVGMRLTSRVVEQRQRVA 40 



ACGGAGTGGTCGGGAATCACGGTTTCGCAGATGTTGCAATGCATTGTCACGCTGATGCCG 47 5 
T E W S G ITVSQMLQCIVTL M P_ 60 



CTGGGCGCCGCGGTGGTGGACACCCATCGCGACGTTGTCTACCTCAACGAACGGGCCAAA 535 
L G A A V V DTHRDVVYLNERAK 80 



GAGCTAGGTCTGGTGCGCGACCGCCAGCTCGATGATCAGGCCTGGCGGGCCGCCCGGCAG 595 
ELGLVRDRQLDDQAWRAARQ 100 



GCGCTGGGTGGTGAAGACGTCGAGTCCGACCTGTCGCCGCGCAAGCGGTCGGCCACGGGT 655 
ALGGEDVESDLS PRKRSATG 120 



CGATCCGGGCTATCAGTGCATGGGCATGCCCGGTTGCTGAGCGAGGAAGACCGCCGGTTC 715 
RSGLSVHGHARLLSEEDRRF 140 



GCCGTGG7GTTCGTGCACGACCAGTCGGATTATGCGCGGATGGAGGCGGCTAGGCGTGAC 775 
A V V FV H OQ S D Y A RM EAARR D 160 



TTCGTGGCCAACGTCAGTCACGAGCTCAAGACGCCCGTCGGTGCCATGGCTCTACTCGCC 835 
F V A N VSHELKTPV G A M A L L A 180 
t H 

FIG.2 
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GAGGCGCTGCTGGCGTCGGCCGACGACTCCGAAACCGTTCGGCGGTTCGCCGAGAAGGTG 8 95 
EALLASADDSETVRRFAEKV 200 



CTCATTGAGGCCAACCGGCTCGGTGACATGGTCGCCGAGTTGATCGAGCTATCCCGGCTA 955 
LIEANRLGDMV. AELIELSRL 220 



CAGGGCGCCGAGCGGCTACCCAATATGACCGACGTCGACGTCGATACGATTGTGTCGGAA 1015 
QGAERLPNM TDVDVDTIVSE 240 



GCGATTTCACGCCATAAGGTGGCGGCCGACAACGCCGACATCGAAGTCCGCACCGACGCG 1075 

AISRHKVAADNADIEVRTDA 260 

CCCAGCAATCTGCGGGTGCTGGGCGACCAAACTCTGCTGGTTACCGCACTGGCAAACCTG 1135 

PSNLRVLGDQTLL V T A I, A N L 250 

N 

GTTTCCAATGCGATTGCCTATTCGCCGCGCGGGTCGCTGGTGTCGATCAGCCGTCGCCGT 1195 

v S N A IAYSPRGSLVSISRRR 300 



CGCGGTGCCAACATCGAGATCGCCGTCACCGACCGGGGCATCGGCATCGCGCCGGAAGAC 1255 
RGANIEIA VTDRGIGIA P E D 320 

Gl 

CAGGAGCGGGTCTTCGAACGGTTCTTCCGGGGGGACAAGGCGCGCTCGCGTGCCACCGGA 1315 
Q E R V F E R F FRGDKARSRATG. 340 



GGCAGCGGACTCGGGTTGGCCATCGTCAAACACGTCGCGGCTAATCACGACGGCACCATC 1375 
G S G L G L ATVKHVAANHDGTI 360 



CGCGTG'TGGAGCAAACCGGGAACCGGGTCAACGTTCACCTTGGCTCTTCCGGCGTTGATC 14 35 
RVWSKPGTGSTFTLALPALI 380 



GAGGCCT ATCACGACGACGAGCGACCCGAGCAGGCGCGAGAGCCCGAACTGCGGTCAAAC 14 95 
EAYHDDERPEQAREPELRSN 400 



AGGTCACAACGAGAGGAAGAGCTGAGCCGATGACCTGCGCCGACGACGATGCAGAGCGTA 1555 
RSQREEELSR 410 



F 



G2 
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GCGATGAGGTGGGGGCACCACCCGCTTGCGGGGGAGAGTGGCGCTGATGACCTGCGCCGA 1615 

CGACGATGCAGAGCGTAGCGATGAGGTGGGGGCACCACCCGCTTGCGGGGGAGAGTGGCG 1675 

CTGATGACCAGTGTGTTGATTGTGGAGGACGAGGAGTCGCTGGCCGATCCGCTGACGTTT 17 35 
MTSVLIVEDEESLADPLTF 19 



CTGCTGCGCAAGGAGGGCTTTGAGGCCACGGTGGTGACCGATGGTCCGGCAGCTCTCGCC 17 95 
LLRKEGFEATVVTDGPAALA 39 



GAGTTCGACCGGGCCGGCGCCGACATCGTCCTGCTCGATCTGATGCTGCCTGGGATGTCG 18 55 
EFDRAGADIVLLDLMLPGMS 59 



GGT ACCG ATGTATGCAAGCAGTTGCGCGCTCGGTCCAGCGTTCCGGTGATCATGGTGACC 1915 
GTDVCKQLRARSSVPVIMVT 79 



GCCCGGGATAGCGAGATCGACAAGGTGGTCGGCCTGGAGCTGGGCGCTGACGACTACGITG 197 5 
ARDSEIDKVVGLELGADDYV 99 



ACCAAGCCCTATTCGGCACGCGAGTTGATCGCACGCATCCGCGCGGTGCTGCGCCGTGGC 2035 
TKPYSARELIARIRAVLRRG 119 



GGCGACGACGACTCGGAGATGAGCGATGGCGTGCTGGAGTCCGGGCCGGTTCGCATGGAT 2095 
GDDDSEMSDGVLESGPVRMD 139 



GTGGAGCGCCATGTCGTCTCGGTGAACGGTGACACCATCACGCTGCCGCTCAAGGAGTTC 2155 
VERHVVSVNGDTITLPLKEF 159 



GACCTGCTGGAATACCTGATGCGCAACAGCGGGCGGGTGTTGACTCGCGGACAACTGATC 2215 
DLLEYLMRNSGRVLTRGQLI 179 



RogX3 -» 



T 




( su i te ) 
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GACCGGGTCTGGGGTGCGGACTACGTGGGCGACACCAAGACGCTCGACGTCCATGTCAAG 227 5 
DRVWGADYVGDTKTLDVHVK 199 



CGGCTGCGCTCCAAG ATCGAAGCCGACCCGGCTAACCCGGTTCACTTGGTGACGGTGCGC 2335 

RLRSKI EADPANPVHLVTVR 219 

GGGCTGGGCTACAAACTCGAGGGCTAGCGGACGCC'GACAACCTTGGCGACTGTCTGGTCG 2395 
GLGYKLEG 22 7 

GCTACGGCCAGTGCCATCGCCATGATGGACAGCTGCGGGTTCACTTCCGGGCAGCTGGGC 2 4 5 5 

AGGATCGAGGCGTCGGCAACCCACACGCCCTCGACGCCGCGCAGCCGGCCCGTCGCGTCG 2515 

ACCGGACAAAGCTGCTCGTCGGCGCCGGCGGCCGCGGTGCCCGTCGGATGGAAGGCGGCC 257 5 

AGGTGCAGGCTTCTGGGGTTGGCTCGGCGCAGCACATCCTGCAGCTCGGGCAGGGACCGC 2635 

ATCGGTGGGGCGCCGGGGATACCGGTCAGCACCTCCACCGCGCCGGCGGCAAAGAACAGC 2695 

CGGCCAATGGCCTGCAGCGCGACCCGTAGCTTGGCGATCTCACCTGGAGCTATGTCATAG 27 55 

CGCACCACCGTCTCGCCGCGCACCGACCGCACCGTGCCGACGCCCCGATCGGCCACCATC 2815 

GCCCCGAATGTTGCGATCTGCGGCGCCCGGTCGAGCCAGCGGAGCAGCTCGGCCCCGTAG 2875 

CCGGGGAAGACCATCGACCCCATGCCCGGCGGTGTGGAGGTGGCCTCGATCAGCACGCCG 2935 

TCGGATTCGTGAAACTCGTGAACCGCCGCGCTCTGCAGCACCCCGCGCCACGCGAAGACG 2995 

TCGTCGTCGAAGAGCCCGGCCAGCATAGTTGCCGGGTGCAGCGCAAGGTTGTGGCCCAGT 3055 

CGCGGTGCCCACCAAGACCGCTGCGCCGCAACAGCCCTGGCGTCTCCGTCGCACCGGCGG 3115 

CG ACGACGACCGCGTCGGCCAGCACGTCGAGTGTGGTGCCGTCGGGCCGGCGGGCTCGCA 3175 
CGCCATAGGCCCGCCCGGCGCGGTGCAGGATCC 3208 
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B. Mycobacterium tuberculosis 
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